查看原文
其他

ChatGPT 再次进化:一次对话,多种功能!

lencx 浮之静 2023-10-30
Image by lencx via DALL-E 3

ChatGPT 即将迎来一波重大更新,主要有两点(老规矩,目前此功能正在灰度测试,逐步向所有 Plus 用户推送):

  • 文档对话:与任何上传的 PDF 文件或数据文件进行对话。

  • GPT-4 All Tools:在一个 Chat 会话中同时使用多种工具,如高级数据分析(Advanced data analysis)、网络浏览(Browse with Bing)和 DALL-E 3,无需切换。

除了已经确定的 GPT-4 All Tools 外,@btibor91 还扒出了一个新的东西 GPT-4 Magic Create,大家可以猜测一下。

文档对话

通过原生 ChatGPT 界面(GPT-4)轻松地与文档和论文聊天。

网友分享表示,它还支持搜索文档中你所指定的内容,然后返回与之相关的上下文结果。此功能势必会给 ChatPDF[1],以及其他提供类似功能的 AI 工具带来不小的冲击。

混合工具

如果我们可以在聊天的上下文随时切换模型,它带来的影响将是无法估计的。比如使用 GPT-4V 来识别图像,提出生成图片的要求,然后 ChatGPT 会根据这些要求自动将模型切换到 DALL-E3 来生成图片。以下是一些具体案例,来自于 @ldjconfirmed 的分享。

案例一

上传图片到对话框,利用图像识别(GPT-4V)和提示词生成新图像(DALL-E 3)。

继续上传图片,识别图片中的滑板元素,直接将其添加到新的图像生成中。

案例二

在不提供任何信息的情况下,直接生成科罗拉多州丹佛市当前的天气和时间的图片。这里同时使用了 Browse with Bing 和 DALL-E 3 能力。

案例三

搜索并获取 2023 年大西洋飓风季节的数据,制作一个代表飓风类别级别和飓风大小的信息图。根据它预测明年飓风最可能出现的位置,生成一张图片。

案例四

让水豚穿上教皇同款羽绒服,并且保持与水豚图片相同的环境和艺术风格。

案例五

识别图片,生成图片,再从图片中提取数据保存到 CSV 文件中。

📌 CSV

CSV 文件是“逗号分隔值”(Comma-Separated Values)的缩写,它是一种简单的文件格式,用于存储表格数据,如电子表格或数据库。在 CSV 文件中,每一行代表一条数据记录,而记录中的各个数据字段则通过逗号或其他分隔符(如制表符)进行分隔。由于其简单性和广泛的应用,许多程序和应用都支持 CSV 格式,如 Microsoft Excel 和其他电子表格软件。

总结

套壳没前途,缺乏真正的护城河。

GPT-4 All Tools 集成多种工具模型到一个聊天上下文中,极大地提高 ChatGPT 的效率和实用性,让我们离拥有一个全能的 AI 助手更近了一步。

GPT-4 API 的发布催生了一系列更像是功能而非独立公司的产品涌现(即:多以各种套壳服务为主,缺乏与产品进行深度整合),这些缺乏护城河的初创公司随时会因为 OpenAI 发布的某一个新功能,而面临倒闭风险。如果你正在开发类似产品,则需要认真思考一下了,将功能定位在 OpenAI 的战略规划上,随时会面临死亡威胁。

最后分享一个我最近看到的一个产品和 GPT-4 进行深度整合的例子:波士顿动力机器狗,整合 GPT-4 后的机器狗进一步加强了互动能力(可以识别物体,进行思考,与人进行对话),了解更多 Robots That Can Chat[2],详细视频 Making Chat (ro)Bots[3]

References

[1]

ChatPDF: https://www.chatpdf.com

[2]

Robots That Can Chat: https://bostondynamics.com/blog/robots-that-can-chat/

[3]

Making Chat (ro)Bots: https://youtu.be/djzOBZUFzTw?si=7bhVvfQtyH2fA6Yx

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存